最佳市场制造的随机控制问题是定量融资的核心问题之一。在本文中,对基于强化的学习控制器进行了培训,该控制器受到弱一致的多元鹰队基于过程的限制订单模拟器的培训,以获得市场制作控制。拟议的方法利用了蒙特卡洛进行了重新测试的优势,并有助于在弱一致的限制订单簿模型下进行市场开发的研究线。随后的深入增强学习控制器与多个市场制作基准进行了比较,结果表明,即使在大量的交易成本下,它在各种风险奖励指标方面都具有出色的性能。
translated by 谷歌翻译